智能论文笔记

Visuo-Tactile Manipulation Planning Using Reinforcement Learning with Affordance Representation

Wenyu Liang , Fen Fang , Cihan Acar , Wei Qi Toh , Ying Sun , Qianli Xu , Yan Wu

分类：机器人

2022-07-14

越来越多的人期望在对象属性具有高感知不确定性的越来越多的非结构化环境中操纵对象。这直接影响成功的对象操纵。在这项工作中，我们提出了一个基于增强的学习动作计划框架，用于对象操纵，该框架既利用了在现有的多感觉反馈，也可以使用学习的注意力引导的深层负担能力模型作为感知状态。可承受的模型是从多种感官方式中学到的，包括视觉和触摸（触觉和力/扭矩），旨在预测和指示具有相似外观的物体的多个负担能力（即抓地力和推动力）的可操作区域属性（例如，质量分布）。然后，对基于DQN的深钢筋学习算法进行培训，以选择成功对象操纵的最佳动作。为了验证提出的框架的性能，使用开放数据集和收集的数据集对我们的方法进行评估和基准测试。结果表明，所提出的方法和整体框架的表现优于现有方法，并实现更好的准确性和更高的效率。

translated by 谷歌翻译

Distributed Stochastic Gradient Descent with Cost-Sensitive and Strategic Agents

Abdullah Basar Akbay , Cihan Tepedelenlioglu

分类：机器学习 | 人工智能

2022-12-05

This study considers a federated learning setup where cost-sensitive and strategic agents train a learning model with a server. During each round, each agent samples a minibatch of training data and sends his gradient update. As an increasing function of his minibatch size choice, the agent incurs a cost associated with the data collection, gradient computation and communication. The agents have the freedom to choose their minibatch size and may even opt out from training. To reduce his cost, an agent may diminish his minibatch size, which may also cause an increase in the noise level of the gradient update. The server can offer rewards to compensate the agents for their costs and to incentivize their participation but she lacks the capability of validating the true minibatch sizes of the agents. To tackle this challenge, the proposed reward mechanism evaluates the quality of each agent's gradient according to the its distance to a reference which is constructed from the gradients provided by other agents. It is shown that the proposed reward mechanism has a cooperative Nash equilibrium in which the agents determine the minibatch size choices according to the requests of the server.

translated by 谷歌翻译

Unsupervised EHR-based Phenotyping via Matrix and Tensor Decompositions

Florian Becker , Age K. Smilde , Evrim Acar

分类：机器学习 | (统计)机器学习

2022-09-01

计算表型可以无监督发现患者的亚组以及电子健康记录（EHR）的相应同时发生的医疗状况。通常，EHR数据包含人口统计信息，诊断和实验室结果。发现（新颖的）表型具有预后和治疗价值的潜力。为医生提供透明且可解释的结果是一项重要要求，也是推进精确医学的重要组成部分。低级别数据近似方法，例如矩阵（例如，非负矩阵分解）和张量分解（例如，candecomp/parafac），已经证明它们可以提供这种透明且可解释的见解。最近的发展通过合并不同的限制和正规化来促进可解释性，从而适应了低级数据近似方法。此外，它们还为EHR数据中的共同挑战提供解决方案，例如高维度，数据稀疏性和不完整性。尤其是从纵向EHR中提取时间表型，近年来引起了很多关注。在本文中，我们对计算表型的低级别近似方法进行了全面的综述。现有文献根据矩阵与张量分解归类为时间与静态表型方法。此外，我们概述了验证表型的不同方法，即评估临床意义。

translated by 谷歌翻译

A Meta-Reinforcement Learning Algorithm for Causal Discovery

Andreas Sauter , Erman Acar , Vincent François-Lavet

分类：机器学习 | 人工智能

2022-07-18

因果发现是一项主要任务，对于机器学习至关重要，因为因果结构可以使模型超越基于纯粹的相关推理并显着提高其性能。但是，从数据中找到因果结构在计算工作和准确性方面都构成了重大挑战，更不用说在没有干预的情况下不可能。在本文中，我们开发了一种元强化学习算法，该算法通过学习执行干预措施以构建明确的因果图来执行因果发现。除了对可能的下游应用程序有用外，估计的因果图还为数据生成过程提供了解释。在本文中，我们表明我们的算法估计了与SOTA方法相比，即使在以前从未见过的基本因果结构的环境中也是如此。此外，我们进行了一项消融研究，展示了学习干预措施如何有助于我们方法的整体表现。我们得出的结论是，干预措施确实有助于提高性能，从而有效地对可能看不见的环境的因果结构进行了准确的估计。

translated by 谷歌翻译

FedHeN: Federated Learning in Heterogeneous Networks

Durmus Alp Emre Acar , Venkatesh Saligrama

分类：机器学习

2022-07-07

我们为通过异质网络提供了一种新颖的培训配方，用于联合学习，每个设备都可以具有不同的体系结构。我们介绍了培训，并以较高复杂性的设备为附带目标，以在联合环境中共同培训不同的体系结构。我们从经验上表明，与最先进的方法相比，我们的方法改善了不同架构的性能，并导致沟通节省高。

translated by 谷歌翻译

Bilingual by default: Voice Assistants and the role of code-switching in creating a bilingual user experience

Helin Cihan , Yunhan Wu , Paola Peña , Justin Edwards , Benjamin Cowan

分类：自然语言处理

2022-06-20

语音助手等对话用户界面非常受欢迎。然而，它们被设计为默认情况下是单语的，缺乏对双语对话体验的支持或敏感性。在此挑衅论文中，我们强调了双语用户VA互动中面临的语言生产挑战。我们认为，通过促进双语互动中看到的现象，例如代码转换，我们可以为双语用户提供更具包容性和改进的用户体验。我们还通过支持多种语言识别，并对语音输出中代码转换的偏好敏感，探索可以实现这一目标的方法。

translated by 谷歌翻译

A Free Lunch with Influence Functions? Improving Neural Network Estimates with Concepts from Semiparametric Statistics

Matthew J. Vowels , Sina Akbari , Necati Cihan Camgoz , Richard Bowden

分类：机器学习 | (统计)机器学习

2022-02-18

通常使用参数模型进行经验领域的参数估计，并且此类模型很容易促进统计推断。不幸的是，它们不太可能足够灵活，无法充分建模现实现象，并可能产生偏见的估计。相反，非参数方法是灵活的，但不容易促进统计推断，并且仍然可能表现出残留的偏见。我们探索了影响功能（IFS）的潜力（a）改善初始估计器而无需更多数据（b）增加模型的鲁棒性和（c）促进统计推断。我们首先对IFS进行广泛的介绍，并提出了一种神经网络方法“ Multinet”，该方法使用单个体系结构寻求合奏的多样性。我们还介绍了我们称为“ Multistep”的IF更新步骤的变体，并对不同方法提供了全面的评估。发现这些改进是依赖数据集的，这表明所使用的方法与数据生成过程的性质之间存在相互作用。我们的实验强调了从业人员需要通过不同的估计器组合进行多次分析来检查其发现的一致性。我们还表明，可以改善“自由”的现有神经网络，而无需更多数据，而无需重新训练。

translated by 谷歌翻译

Federated Learning Based on Dynamic Regularization

Durmus Alp Emre Acar , Yue Zhao , Ramon Matas Navarro , Matthew Mattina , Paul N. Whatmough , Venkatesh Saligrama

分类：机器学习

2021-11-08

我们提出了一种用于分布式培训神经网络模型的新型联合学习方法，其中服务器在每轮中随机选择的设备的子集之间编制协作。我们主要从通信角度查看联合学习问题，并允许更多设备级别计算来节省传输成本。我们指出了一个基本的困境，因为当地 - 设备水平的最低实证损失与全球经验损失的最小值不一致。与最近的事先有关的不同，尝试无所作用的最小化或利用用于并行化梯度计算的设备，我们为每轮的每个设备提出动态规范器，以便在极限中，全局和设备解决方案对齐。我们通过实证结果对真实的和合成数据以及我们的方案在凸和非凸面设置中导致有效培训的分析结果，同时对设备异质性完全不可知，以及大量设备，部分参与和不平衡的数据。

translated by 谷歌翻译

Faster Convex Lipschitz Regression via 2-block ADMM

Ali Siahkamari , Durmus Alp Emre Acar , Christopher Liao , Kelly Geyer , Venkatesh Saligrama , Brian Kulis

分类： (统计)机器学习 | 机器学习

2021-11-02

近似任意凸起函数的任务是在诸如凸起回归的几个学习问题中，学习具有凸（DC）功能的差异，以及近似Bregman分歧。在本文中，我们展示了如何通过2块ADMM方法来解决广泛的凸函数学习问题，其中每个块的更新可以以封闭的形式计算。对于Convex Lipschitz回归的任务，我们建立了我们所提出的算法以$ o（n ^ 3 d ^ {1.5} + n ^ 2 d ^ {2.5} + nd ^ 3）$ for tata r x $ x \在r ^ {n \ times d} $。如果$ d = o（n ^ 4）$。此外，我们提供了类似的DC回归和Bregman发散学习的求解器。与以前的方法不同，我们的方法适用于GPU。我们展示了回归和度量学习实验，即我们的方法比现有方法快20倍，并产生与最先进的结果相当的结果。

translated by 谷歌翻译

An AO-ADMM approach to constraining PARAFAC2 on all modes

Marie Roald , Carla Schenker , Vince D. Calhoun , Tülay Adalı , Rasmus Bro , Jeremy E. Cohen , Evrim Acar

分类：机器学习 | (统计)机器学习

2021-10-04

在数据挖掘，神经科学和化学计量学在内的各个领域，分析各种数据集中的多路测量结果是一个挑战。例如，测量可能会随着时间的流逝而发展或具有不一致的时间曲线。 PARAFAC2模型已成功地用于分析此类数据，通过在一种模式（即演变模式）下允许基础因子矩阵跨切片进行更改。拟合PARAFAC2模型的传统方法是使用基于最小二乘的交替算法，该算法通过隐式估计不断发展的因子矩阵来处理Parafac2模型的恒定交叉产生约束。这种方法使对这些因素矩阵充满挑战。目前尚无算法可以灵活地将这种正规化施加，并具有一般的惩罚功能和硬性约束。为了应对这一挑战并避免隐性估计，在本文中，我们提出了一种算法，用于拟合PARAFAC2基于与乘数交替方向方法（AO-ADMM）的交替优化拟合parafac2。通过在模拟数据上进行数值实验，我们表明所提出的PARAFAC2 AO-ADMM方法允许灵活约束，准确地恢复了基础模式，并且与先进的ART相比，计算有效。我们还将模型应用于神经科学和化学计量学的两个现实世界数据集，并表明限制发展模式可改善提取模式的解释性。

translated by 谷歌翻译